課程資訊
課程名稱
資料科學與社會研究
Data Science and Social Inquiry 
開課學期
107-1 
授課對象
社會科學院  經濟學系  
授課教師
林明仁 
課號
ECON5154 
課程識別碼
323 U1200 
班次
 
學分
2.0 
全/半年
半年 
必/選修
選修 
上課時間
星期一3,4(10:20~12:10) 
上課地點
社科502 
備註
「資料科學與社會分析」學士班跨域專長必修課。與謝吉隆合授
限學士班三年級以上 或 限碩士班以上
總人數上限:60人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1071ECON5154 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

“Data science is an emerging discipline that draws upon knowledge in statistical methodology and computer science to create impactful predictions and insights?for a wide range of traditional scholarly fields.”

-Harvard Data Science Initiative

藉由社會科學各領域與資料科學互動密切研究者的分享,讓同學了解社會科學domain knowledge 在大數據研究中所能扮演的角色。並藉由初階的R語言與web crawling實作,帶領學生實際從事如何以資料科學進行對社會的探索。

社會科學家的工作即是描述、解釋、甚至預測社會現象。我們首先建構人類行為的理論,接著觀察社會並收集、分析資料,在理論與實證的不斷互動中 持續修正我們對這個世界的想像與看法。政治學、經濟學與社會學或許有不同的關心議題與切入視角,但是這個過程,一直是社會科學重要的核心方法論之一。
然而過去幾年來,由於資料運算與儲存技術的爆炸性成長,Big Data 的興起從根本上改變了社會科學家看待資料的方式! 我們不再只能依賴傳統的調查問卷, 而可以從網路或其他的資料儲存處,直接抓取人類行為的軌跡加以分析。這個改變,讓我們能觀察到人類更多面向的行為並探究其複雜性。過去幾年來,社會科學家已經在各領域利用Big Data取得不少的研究成果。本門課程邀請國內對大數據研究有心得的社會科學研究者,來跟大家分享,他們的研究,如何跟大數據擦出火花?
 

課程目標
一、 課程概述
“Data science is an emerging discipline that draws upon knowledge in statistical methodology and computer science to create impactful predictions and insights for a wide range of traditional scholarly fields.”
-Harvard Data Science Initiative
社會科學家的工作即是描述、解釋、甚至預測社會現象。我們首先建構人類行為的理論,接著觀察社會並收集、分析資料,在理論與實證的不斷互動中 持續修正我們對這個世界的想像與看法。政治學、經濟學與社會學或許有不同的關心議題與切入視角,但是這個過程,一直是社會科學重要的核心方法論之一。
然而過去幾年來,由於資料運算與儲存技術的爆炸性成長,Big Data 的興起從根本上改變了社會科學家看待資料的方式! 我們不再只能依賴傳統的調查問卷, 而可以從網路或其他的資料儲存處,直接抓取人類行為的軌跡加以分析。這個改變,讓我們能觀察到人類更多面向的行為並探究其複雜性。過去幾年來,社會科學家已經在各領域利用Big Data取得不少的研究成果。本門課程邀請國內對大數據研究有心得的社會科學研究者,來跟大家分享,他們的研究,如何跟大數據擦出火花?

二、 教學目標

藉由社會科學各領域與資料科學互動密切研究者的分享,讓同學了解社會科學domain knowledge 在大數據研究中所能扮演的角色。並藉由初階的R語言與web crawling實作,帶領學生實際從事如何以資料科學進行對社會的探索。
 
課程要求
評分標準
上課參與:20%(到課率、發問等)
課後作業:20%
期中報告:20% 於各主題擇一,繳交一份1000字以內的報告。報告內容須包含兩部分: 第一部份為演講主題摘要(300字以內),第二部份則選定一個主題,先定義研究問題,簡單描述所需資料變數為何,以及所採取的分析方法跟可能的結果。本份報告不需要實際收集資料與執行分析,比較像是研究主題的發想與初步草圖。

期末報告40%
三-四人一組,組內需涵蓋社科院至少三個系以上成員。報告內容須包括: (1)研究主題的定義與重要性,(2)資料取得、呈現、與分析,以及(3) 結論的可信度。
 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
TBA 
參考書目
待補 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第1週
9/10  Class introduction and What is Social Inquiry? 林明仁 (台大經濟系)/謝吉隆 (台大新聞所) 
第2週
9/17  R basic謝吉隆 (台大新聞所) 
第3週
9/24  Holiday 
第4週
10/1  R Basics謝吉隆 (台大新聞所) 
第5週
10/8  R Basics 謝吉隆 (台大新聞所) 
第6週
10/15  R Basics 謝吉隆 (台大新聞所) 
第7週
10/22  R Basics 謝吉隆 (台大新聞所) 
第8週
10/29  Getting CSV and JSON plus XML or Accessing Database謝吉隆 (台大新聞所) 
第9週
11/5  Getting data from Social media, e.g., facebook, twitter, flickr謝吉隆 (台大新聞所) 
第10週
11/12  Crawling web data, e.g. ptt 謝吉隆 (台大新聞所) 
第11週
11/19  Data Science and Economics 陳釗而( 東京國際大學) 
第12週
11/26  Data Science in Sociology 江彥生 (中研院社會所) 
第13週
12/3  Data Science in Psychology 黃從仁 (台大心理系) 
第14週
12/10  Data Science in Geography 溫在弘 (台大地理系) 
第15週
12/17  Data Science in Humanity 謝舒凱(台大語言所) 
第16週
12/24  智庫驅動 謝宗震執行長 
第17週
12/31  Holiday 
第19週
1/14  Student Presentation